恢復時間目標和恢復點目標聽起來很相似,但它們在災難恢復和業(yè)務(wù)連續(xù)性管理中是完全不同的指標。了解如何在需要之前使用適當?shù)馁Y源進行相應(yīng)的計劃。就像擁有保險一樣,您可能永遠不會使用它——或者它可能會拯救您的公司。在本文中,我們將研究 RPO 和 RTO 之間的關(guān)鍵區(qū)別并消除任何混淆!
RTO:恢復時間目標
RTO 決定了您的基礎(chǔ)設(shè)施在災難發(fā)生后需要多快恢復在線。有時,我們使用 RTO 來定義公司可以處理和維持業(yè)務(wù)連續(xù)性的最長停機時間。這通常是災難后恢復服務(wù)的目標時間。例如,2 小時的恢復時間目標旨在在收到服務(wù)中斷通知的兩小時內(nèi)備份并運行所有內(nèi)容。
有時,這樣的 RTO 是無法實現(xiàn)的。颶風或洪水會導致企業(yè)倒閉,長達數(shù)周之久。但是,一些組織對中斷的恢復能力更強。例如,一家小型管道公司可以處理一周或更長時間的文書工作訂單和發(fā)票。依賴訂閱的基于 Web 的應(yīng)用程序的企業(yè)可能會在幾個小時后癱瘓。
對于外包 IT 服務(wù),RTO 是在 服務(wù)水平協(xié)議 (SLA) 中定義的。IT 和其他服務(wù)提供商通常在其 SLA 中包含以下支持條款:
- 可用性: 您可以致電尋求支持的時間。
- 響應(yīng)時間: 他們在收到支持請求后與您聯(lián)系的速度。
- 解決時間: 他們恢復服務(wù)的速度。
根據(jù)您的業(yè)務(wù)需求,您可能需要更好的 RTO。有了它,成本也會增加。無論您選擇哪種 RTO,它都應(yīng)該對您的組織具有成本效益。企業(yè)可以在內(nèi)部處理 RTO。如果您有內(nèi)部 IT 部門,則應(yīng)該有解決技術(shù)問題的目標。實現(xiàn) RTO 的能力取決于災難的嚴重程度。服務(wù)器崩潰可以達到一小時的目標。但是,如果該地區(qū)發(fā)生自然災害,期望一個小時的解決方案可能并不現(xiàn)實。RTO 不僅包括從災難中恢復所需的時間。它還應(yīng)該包括減輕不同災難或從不同災難中恢復的步驟。該計劃需要包含對措施的適當測試
RPO:恢復點目標
RPO 衡量 服務(wù)中斷后可接受的數(shù)據(jù)丟失量。例如,銷售損失可能會在 18 小時后成為成本的過度負擔。該閾值可能會使公司低于任何銷售目標。
數(shù)據(jù)的備份和鏡像副本是 RPO 解決方案的重要組成部分。有必要知道有多少數(shù)據(jù)是可接受的損失。一些企業(yè)通過計算存儲成本與恢復成本來解決這個問題。這有助于確定創(chuàng)建備份的頻率。其他企業(yè)使用云存儲來創(chuàng)建其數(shù)據(jù)的實時克隆。在這種情況下,故障轉(zhuǎn)移會在幾秒鐘內(nèi)發(fā)生。
與 RTO 和可接受的停機時間類似,一些企業(yè)對數(shù)據(jù)的丟失容忍度更高。為小型管道公司檢索 18 小時的記錄是可能的,但可能不會損害業(yè)務(wù)運營。相比之下,在線計費公司可能會在幾分鐘的數(shù)據(jù)丟失后發(fā)現(xiàn)自己陷入困境。
RPO按時間和技術(shù)分類:
- 8-24 小時: 這些目標依賴于生產(chǎn)環(huán)境的外部存儲數(shù)據(jù)備份。最后一個可用備份用作還原點。
- 最多 4 小時: 這些目標需要生產(chǎn)環(huán)境的持續(xù)快照。在災難中,恢復數(shù)據(jù)的速度更快,對您的業(yè)務(wù)造成的干擾更少。
- 接近于零: 這些目標使用企業(yè)云備份和存儲解決方案來鏡像或復制數(shù)據(jù)。通常,這些服務(wù)會在多個地理位置復制數(shù)據(jù)以實現(xiàn)最大冗余。故障轉(zhuǎn)移和故障恢復是無縫的。
RTO 和 RPO 都涉及測量的時間段。然而,雖然 RTO 專注于使硬件和軟件聯(lián)機,但 RPO 專注于可接受的數(shù)據(jù)丟失。
風險計算
RTO 和 RPO 都是風險計算。RTO 是對企業(yè)可以維持服務(wù)中斷多長時間的計算。RPO 是對數(shù)據(jù)在恢復時的最新程度的計算。
計算 RTO
我們基于預測和 風險管理來計算 RTO 。與很少使用的應(yīng)用程序一樣,頻繁使用的應(yīng)用程序可能對業(yè)務(wù)連續(xù)性至關(guān)重要。因此,應(yīng)用程序的重要性不必與使用頻率相同。您需要確定哪些服務(wù)可以在多長時間內(nèi)不可用,以及它們是否對您的業(yè)務(wù)至關(guān)重要。
要計算 RTO,請考慮以下因素:
- 每小時停電成本
- 單個系統(tǒng)的重要性和優(yōu)先級
- 減輕災難或從災難中恢復所需的步驟(包括單個組件或流程)
- 回收解決方案的成本/收益方程
計算 RPO
計算 RPO 也是基于風險。在災難中,一定程度的數(shù)據(jù)丟失可能迫在眉睫。RPO 成為 數(shù)據(jù)丟失對業(yè)務(wù)的影響和緩解成本之間的平衡行為。一些憤怒的客戶,因為他們的訂單丟失了,可能是可以接受的損失。相比之下,數(shù)百筆交易丟失可能對企業(yè)造成巨大打擊。
在確定您的 RPO 時,請考慮以下因素:
- 您的組織可以承受的最大可容忍數(shù)據(jù)丟失量。
- 丟失數(shù)據(jù)和操作的成本
- 實施恢復解決方案的成本
RPO 是備份之間可接受的最大時間。如果每 6 小時執(zhí)行一次數(shù)據(jù)備份,并且在備份后 1 小時發(fā)生災難,則您只會丟失一小時的數(shù)據(jù)。這意味著您比預計的 RPO 少了 5 個小時。
災難恢復計劃
災難有多種形式。例如自然災害、颶風、洪水或野火。災難還可以指資產(chǎn)或基礎(chǔ)設(shè)施(如電力線、橋梁或服務(wù)器)的災難性故障。災難包括所有 類型的網(wǎng)絡(luò)安全攻擊 ,這些攻擊會破壞您的數(shù)據(jù)、破壞信用卡信息,甚至禁用整個站點。災難的定義如此之多,根據(jù)它們的共同點來定義它們是有幫助的。對于組織和 IT 部門而言, 災難是破壞正常業(yè)務(wù)運營的事件。
應(yīng)對災害始于計劃和預防。 許多企業(yè)在不同的地理區(qū)域使用云解決方案來最大程度地降低停機風險。有些安裝冗余硬件以保持 IT 基礎(chǔ)架構(gòu)運行。數(shù)據(jù)恢復的一個關(guān)鍵步驟是制定災難恢復計劃。
考慮不同類型災難的概率。各種災害可能需要不同的應(yīng)對計劃。例如,在太平洋西北部,颶風很少發(fā)生,但可能會發(fā)生地震。在佛羅里達州,情況正好相反。與小型企業(yè)相比,網(wǎng)絡(luò)攻擊可能對擁有廣泛在線業(yè)務(wù)的大型企業(yè)構(gòu)成更大的威脅。DDoS 攻擊可能需要與數(shù)據(jù)泄露不同的響應(yīng)。
與 臨時解決方案相比,災難恢復計劃 有助于更快地使系統(tǒng)和流程聯(lián)機。當每個人都扮演特定的角色時,恢復策略可以迅速進行。災難恢復計劃還有助于在您需要資源之前將資源到位。因此,響應(yīng)計劃改進了恢復時間和恢復點目標。
RTO 和 RPO 之間的區(qū)別很關(guān)鍵
雖然密切相關(guān),但必須了解恢復時間目標和恢復點目標之間的區(qū)別。RTO 是指使系統(tǒng)重新聯(lián)機所需的時間。RPO 是可接受的停機數(shù)據(jù)丟失的業(yè)務(wù)計算。立即改進這些指標并采用災難恢復計劃。